Probabilidade e Estatística: A Ciência da Incerteza: Da Probabilidade à Verossimilhança: A Ciência da Inferência

A inferência estatística marca a transição de prever resultados com base em parâmetros conhecidos (probabilidade) para determinar quais parâmetros são mais compatíveis com os dados observados (verossimilhança). Enquanto uma função de densidade de probabilidade $f(x|\theta)$ descreve a distribuição dos dados $x$ para um $\theta$ fixo, a função de verossimilhança $L(\theta|x)$ trata os dados observados como fixos e varia o parâmetro $\theta$ para quantificar o suporte relativo a diferentes hipóteses.

O Princípio da Inversão

A função de verossimilhança é frequentemente expressa na forma da densidade conjunta. Para uma distribuição Normal com variância fixa, a verossimilhança é definida por:

$L ( \theta | x_1, \dots, x_n ) = \exp\left( -\frac{n}{2\sigma_0^2} (\bar{x} - \theta)^2 \right)$

Aqui, avaliamos a "plausibilidade" de diferentes valores de $\theta$ dado a média amostral $\bar{x}$. Para encontrar o pico dessa plausibilidade, utilizamos Definição 6.2.2: a verossimilhança logarítmica $l(\theta | s) = \ln L(\theta | s)$. Essa transformação simplifica produtos de observações independentes em somas, tornando a maximização de modelos complexos viável do ponto de vista computacional.

Exemplo Resolvido: Pesquisa de Alturas (EXEMPLO 6.3.5)

Os Dados

Considere uma amostra de $n=30$ alturas com um desvio padrão calculado de $s=2.379$. Usando o Modelo Normal de Localização-Escala, buscamos inferir a média verdadeira $\theta$.

Inferência e Precisão

O erro padrão é calculado como $s/\sqrt{30} = 0.43434$. Esse valor mede a "agudez" do nosso pico de verossimilhança. Um erro padrão menor implica um pico mais estreito e agudo, representando maior precisão em nossa inferência sobre $\theta$.

Dimensionalidade e Restrições

Em cenários complexos como EXEMPLO 6.1.5 (Modelos Multinomiais), devemos levar em conta dependências lógicas. Como observado, "Note que é realmente apenas bidimensional, porque assim que sabemos o valor de quaisquer dois dos $\theta_i$... imediatamente sabemos o valor do parâmetro restante." Essa restrição é fundamental para definir corretamente o espaço paramétrico $\Omega$.

Fundamentos Assintóticos

A ponte entre verossimilhança e inferência depende do Teorema Central do Limite. À medida que $n \to \infty$, a distribuição dos nossos estimadores converge. Especificamente, no EXEMPLO 6.5.4 Modelo de Bernoulli:

$Z = \frac{\sqrt{n}(\bar{X} - \theta)}{\sqrt{\bar{X}(1 - \bar{X})}} \xrightarrow{D} N(0, 1)$

Isso nos permite quantificar a incerteza usando intervalos z e valores-p, desde que tenhamos amostras suficientemente grandes.

🎯 Princípio Fundamental

Métodos de inferência sem distribuição exigem apenas suposições mínimas sobre a distribuição amostral, tornando-os robustos quando a família $\{P_{\theta} : \theta \in \Omega\}$ é muito grande. Em contraste, os métodos paramétricos de verossimilhança dependem da curvatura da log-verossimilhança, onde a Informação de Fisher $nI(\theta)$ determina a variância da nossa função escore.

QUESTÃO 1

6.1.2: Suponha que suicídios ocorram à taxa $p$ por ano-pessoa (Poisson(Np)). Se observamos 22 suicídios em $N=30.345$ anos-pessoa, qual é a função de log-verossimilhança $l(p)$?

$l(p) = -30345p + 22\ln(p) + C$

$l(p) = 30345\ln(p) - 22p + C$

$l(p) = e^{-30345p} p^{22}$

$l(p) = -22p + 30345\ln(p)$

QUESTÃO 2

6.3.14: Um intervalo de confiança de 0,95 para $\psi(\theta)$ é $(1,23, 2,45)$. Há evidência contra $H_0 : \psi(\theta) = 2$?

Não, porque 2 está dentro do intervalo.

Sim, porque 2 não é o centro do intervalo.

Sim, ao nível de $\alpha=0,01$.

Informação insuficiente para concluir.

QUESTÃO 3

Verifique o terceiro momento de $N(\mu, \sigma^2)$. Qual expressão representa $\mu_3 = E_{\theta}(X^3)$?

$\mu^3 + 3\mu\sigma^2$

$\mu^3 + \sigma^3$

$3\mu^2\sigma + \mu^3$

$\mu^3 + 3\sigma^2$

QUESTÃO 4

6.5.1: Se $x_1, \dots, x_n \sim N(\mu_0, \sigma^2)$ com $\mu_0$ conhecido, qual é a informação de Fisher $I(\sigma^2)$?

$1 / (2\sigma^4)$

$1 / \sigma^2$

$n / (2\sigma^2)$

$2\sigma^4$

QUESTÃO 5

Num modelo Multinomial com k categorias (EXEMPLO 6.1.5), qual é a dimensionalidade efetiva do espaço paramétrico?

$k - 1$

$k$

$k^2$

$1$